《转录因子调控了谁?挖全天下所有高通量实验数据,只为您解决这一个问题》给出了从基因组水平找靶基因的策略和方法:
Plan A:RNA-seq。直接调控?间接调控?傻傻分不清
Plan B:ChIP-seq。最直接,最有效,与RNA-seq整合分析更准确
Plan C:ATAC-seq + motif分析。没有ChIP级别抗体,也能准确找到靶基因
Plan D:基于motif预测,这是个垫底儿的
《哪个蛋白质调控我感兴趣的基因?怎样筛选?基于分析或实验的可行方案V2.1》给出了研究某个基因受谁调控的策略和方法:
Plan A:基于大量ChIP-seq公共数据挖掘
Plan B:motif分析预测
Plan C:ATAC-seq结合motif分析
这些策略适用于所有物种的转录调控研究,但小伙伴们一结合自己的课题,疑问就多了起来。我们一个一个解决。
今天解决这个问题:一段DNA序列上有没有某个转录因子的motif?
话说找motif的工具有很多哇!不好讲哪个好哪个差,谁能找出你心仪的motif谁就是好猫!
方法一
《转录因子调控了谁?》里的Plan D教大家用JASPAR + UCSC Table Browser查某个motif在全基因组范围内分布在哪些基因附近。好烦,我不要全基因组范围,我只要看这一个基因,见方法二和三。
方法二
《互补链上的motif有意义吗?》里的补充技能:用JASPAR2016在线工具,找一段DNA序列上是否存在指定的motif,输入序列长度受限。JASPAR2018提供R包TFBSTools做这件事,要会用R,不接地气。
方法三
meme是个强大的工具箱(此meme非彼meme),以后会以问题为导向,分多篇介绍里面的工具。今天用FIMO,'Find Individual Motif Occurrences',判断一段DNA上是否存在某个motif。还能同时上传多个motif和多条DNA序列,批量判断多个基因上游是否存在某几个motif。
首先,去JASPAR2018下载MEME格式的motif文件。http://jaspar.genereg.net/matrix/MA0106.3/
然后,打开FIMO,http://meme-suite.org/tools/fimo
1. Upload刚刚从JASPAR下载好的meme格式的motif文件;
2. 把感兴趣的DNA序列以fasta格式粘贴到Input the sequences区域,或者upload序列文件;
3. Start search,然后把地址加入收藏栏;
4. 需要运行一段时间,即使浏览器被关掉了,还能从收藏栏里打开结果。
运行结束,页面会变成这样:
两种接地气的查看方式,和一种高大上的展示方式:
一、以表格的形式查看哪个基因上有motif。
点开FIMO HTML.output,显示P<0.0001的Top1000个位点。Alt ID就是你upload的fasta文件里“>”右边的字,建议写基因名。
二、图形化展示输入序列的哪个位置有这个motif,展示效果类似于方法一。
1. 鼠标右键点击FIMO GFF output,复制gff文件地址;
2. 打开网址http://genome.ucsc.edu/cgi-bin/hgCustom,往UCSC genome browser里添加一个新的track,在URLs的框里粘贴gff文件地址,submit。
三、高大上的展示方式。
看这篇:如何画类似MEME的注释序列
据说Y叔还差500粉就能变万人大号了,小伙伴们快去关注啊!
方法四、五、六、七。。。